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基于 极限 学 习 机 的 极 移 中 长 期 预报 
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摘 要 : 传统 的 极 移 预报 多 是 基于 最 小 二 乘 外 推 和 自 Paige 但 极 移 包含 了 复杂 的 非 线 
性 成 分 ， 线 性 模型 的 预报 效果 往往 不 甚 理想。 将 一 种 新 型 神经 一 极限 学 习 机 ( extreme 
eB machine, ELM) 用 于 极 移 中 长 期 预报 。 首 先 利 用 最 小 Bee Rees 
拟 合 ， 获 得 趋势 项 外 推 值 ， 然 后 采用 ELM 对 最 小 二 乘 拟 合 残 差 进行 预报 ， se dang aie 
势 项 外 推 值 与 残 差 预报 值 之 和 。 将 ELM 的 预报 结果 同 反 向 传播 (back propagation, BP) 神经 
络 与 地 球 定 向 参数 预报 比较 活动 (Earth Orientation Parameters Prediction ee 
Campaign, EOP PCC) 的 预报 结 结果 表明 : ELM 用 于 极 移 中 长 期 预报 是 高 效 可 行 的 。 
关键 词 : 极 移 ; 预报 ; 极限 学 习 机 ; HAMA; 预报 模型 
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0 引 言 


地 球 极 移 表 示 地 球 瞬 时 自转 轴 相 对 于 地 球 表面 或 者 历 元 平 极 的 运行 ， 是 表征 地 球 自转 变化 的 
一 个 重要 参量 ， 简 称 极 移动 。 极 移 的 两 个 分 量 x + Yes UT1-UTC 与 岁差 、 章 动 统 称 为 地 球 定 
HZ% (Earth orientation parameters, EOP) , BOP 是 天 球 参考 系 和 地 球 参考 系 相 互 转换 的 必需 
参数 。 其 长 基线 干涉 (Very Long Baseline Interferometry, VLBD 和 全 球 导 航 卫 星系 统 (Global 
Navigation Satellite Systems, GNSS) 等 空间 大 地 测量 技术 的 极 移 测 定 精度 可 达 0.05mas "。 但 由 
于 复杂 的 资料 处 理 过 程 ， 由 空间 大 地 测量 技术 获取 的 极 移 结果 存在 一 定 的 延迟 ， 而 深 空 探测 和 
卫星 精密 定 轨 等 领域 对 极 移 的 实时 测量 值 具 有 重要 需求 ， 所 以 对 极 移 进行 短期 预报 就 显得 尤为 
必要 ， 此 外 ， 极 移 中 长 期 预报 值 在 卫星 自主 导航 和 天 文 地 球 动力 学 研究 中 亦 有 重要 应 用 ， 故 极 
移 的 中 长 期 预报 也 具有 重要 的 科学 及 现实 意义 。 
国内 外 学 者 提出 了 多 种 极 移 预报 方法 , 如 最 小 二 乘 外 推 ”、 自 协 方差 模型 ”、 模糊 推理 系统 “、 
神经 网 络 ”“、 自 回归 模型 “以 及 这 些 模型 的 不 同 组 合 。 受 大 气 和 海洋 等 多 种 激发 源 的 影响 ， 极 
移 呈 现 复 杂 的 非 线 性 、 非 平稳 变化 ， 因 此 采用 神经 网 络 等 非 线 性 方法 对 其 进行 预报 在 理论 上 更 
为 合适 ， 许 多 学 者 将 神经 网 络 应 用 于 极 移 预报 ， 取 得 了 较 好 的 预报 效果 ”""。 国 际 EOP 比 较 活动 
(EOP Prediction Comparison Campaign, EOP PCC) 的 结果 也 表明 ， 神 经 网 络 是 当前 极 移 预 报 
精度 最 高 的 方法 之 一 ”。 

反问 传播 (back propagation, BP) 神经 网 络 是 当前 应 用 最 为 广泛 的 一 种 网 络 学 习 算 法 ， 在 时 
间 序 列 预 测 、 图 像 处 理 和 自动 控制 等 领域 均 有 应 用 ， 但 BP 神经 网 络 存 在 易 陷 入 局 部 极 小 值 、 学 
习 速 度 慢 和 泛 化 能 力 弱 等 缺点 。 极 限 学 习 机 (extreme learning machine, ELM) 是 近年 发 展 起 来 
的 一 种 新 型 单 隐 含 层 前 馈 神 经 网 络 ， 其 特点 是 隐 含 层 神经 元 的 权重 可 以 随机 给 定 ， 且 不 需要 更 
新 ， 网 络 学 习 过 程 仅 计算 输出 权重 ， 故 在 学 习 速 度 与 泛 化 能 力 方面 较 传 统 BP 神 经 网 络 具 有 一 定 
优势 ”。 正 是 基于 此 ， 本 文 将 ELM 神 经 网 络 应 用 于 极 移 中 长 期 预报 ， 根 据 极 移 时 间 序 列 特征 ， 
建立 了 基于 ELM 神 经 网 络 的 极 移 预报 模型 ， 试 验 结 果 验 证 了 ELM 神 经 网 络 应 用 于 极 移 预 报 的 有 
效 性 和 实用 性 。 
1 极限 学 习 机 原理 


给 定 N 个 训练 样本 (x;,y; )， 其 中 输入 向 量 x,= [XX X FeR”, it 


m 


a 


VEV Ya Ya ] Ee R"，u、vy 分 别 为 输入 向 量 维 数 与 输出 向 量 维 数 ， 则 具有 刀 个 隐 含 层 
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节点 的 单 隐 含 层 前 馈 神 经 网 络 能 够 以 零 误 差 来 通 近 这 N 个 样本 ， 即 有 下 式 成 立 ”: 


y=} Bw x +b),i=1,2,..,N D 


RP, w =[w w, 了 为 第 了 个 隐 含 层 神经 元 与 输入 层 神经 元 间 的 连接 权重 ， 


Wa W j2? my 


B, =[B,,B,,,L ,有 ] 为 第 了 个 隐 含 层 神经 元 与 输出 层 神经 元 间 的 连接 权重 ， 为 第 j 个 隐 


会 层 神经 元 的 偏 置 ，g (x) 为 激活 函数 。 式 〈1) 可 以 表示 为 矩阵 相 乘 的 形式 : 
Y=HB (2) 


其 中 ， 石 为 隐 含 层 得 出 矩阵 ; 


ew :x tb) = g(w,:xi+b,) 


H= : : (3) 
g(w xy +b) = g(w,-x,+5,) A 
RLY 
pe a 
T T 
p-| | y} (4) 
By Nxv Vy Nxv 


ELMA SE ZEA BO": 1) 随机 选取 输入 层 权重 w;、 偏 置 b, ，j =1,2,…, 有 hh: 2) 


计算 隐 含 层 输 出 矩阵 五 ，3) 计算 输出 层 权 值 = AY , Hp HÝ 为 矩阵 五 的 Moore-Penrose 
广义 逆 。 
2 预报 方法 


2.1 最 小 二 乘 外 推 
最 小 二 乘 外 推 模型 包含 3 部 分 : 线性 趋势 项 、 钱 德 勒 项 和 周年 项 ， 其 数学 模型 为 


frat t+ [ccos(2 t/T)+d,sin(2 #/7)] (5) 
RP, To T 分 别 为 钱 德 勒 项 和 周年 项 的 振荡 周期 ， 取 人 =432.08d、 T, =365.24d, a. y 


为 趋势 项 参数 ，c 、d 为 钱 德 勒 项 参数 ，c,、d, 代表 周年 项 参数 ， 这 些 未 知 参数 可 以 根据 最 
小 二 乘法 求解。 
2. 2 神经 网 络 模型 构建 

最 小 二 乘 拟 合 残 差 含有 剩余 的 短 周期 成 分 , 也 含有 各 种 准 周期 和 非 线性 成 分 ,对 于 这 些 成 分 ， 
利用 神经 网 络 的 非 线性 拟 合 能 力 对 其 进行 建 模 与 预报 。 依 据 神 经 网 络 模型 构建 与 极 移 预报 的 实 
际 情况 ， 采 用 如 下 方式 确定 网 络 的 输入 和 输出 : 
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[e(t—k-u+l),e(t-—k-u+2),---,e(t-—k)| > e(t) (6) 
其 中 ，8 (为 最 小 二 乘 拟 合 残 差 ，! = 1, 2,…, hn， 为 预报 跨度 。 为 了 提高 数据 利用 紊 ， 采 用 
滑动 窗口 方式 构建 训练 样本 : 
[é(1),€(2),---,€(u)]| > e(u+k) 
[€(2),€(3),---,e€(u+ 1] > e(u+k +1) 


(7) 


[e(n—k-u+l),e(n—k—-ut2),---,e(n—k)]- €(n) 
相应 地 ， 在 预报 阶段 网 络 的 输入 和 输出 为 
[e(n—u+1),e(n—u+2),---,e(n)] > E(n+k) (8) 
其 中 ，E(n 十 及 为 神经 网 络 模型 的 第 大 步 预报 值 。 
由 于 本 文 利用 ELM 神 经 网 络 实现 从 输入 到 输出 的 非 线 性 映射 ， 故 需要 事先 确定 激活 函数 类 型 
和 网 络 拓扑 结构 〈 输 入 层 神 经 元 数 和 隐 含 层 神经 元 数 ) ， 其 中 ， 激 活 函数 选用 Sigmoid 函 数 ， 其 


g(x)=1/(l+e *) (9) 
由 于 网 络 拓扑 结构 对 网 络 性 能 起 着 至 关 重 要 的 影响 ， 为 了 确定 较 优 的 网 络 拓扑 结构 ， 本 文通 
过 观察 网 络 训练 误差 随 输入 层 神经 元 数 和 隐 含 层 神 经 元 数 的 变化 情况 来 优化 网 络 拓扑 结构 ， 即 
网 络 训 练 误 差 最 小 时 所 对 应 的 输入 层 神经 元 数 和 隐 含 层 神经 元 数 为 最 优 输 入 层 和 隐 含 层 神经 元 
数 。 以 预报 跨度 30d 为 例 ， 图 1 给 出 了 网 络 训练 均 方 根 误差 (root mean square error, RMSE) 
随 输入 层 和 隐 舍 层 神经 元 数 的 变化 情况 ， 从 图 1 可 以 看 到 ， 当 输入 层 神经 元 数 为 17、 隐 含 层 神经 
元 数 为 47 时 ， 网 络 训练 均 方 根 误差 最 小 。 


网 络 训练 均 方 根 误差 (RMSE)/ mas 


10 
输入 层 神经 元 数 20 
隐 含 层 神经 元 数 


图 1 网 络 训练 均 方 根 误差 CRMSE) 随 输 入 层 与 输出 层 神经 元 数 的 变化 情况 


Fig. 1 Changes of the network training RMSE with the neutron number of input and hidden layers 


3 方法 验证 
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为 了 评估 ELM 神 经 网 络 用 于 极 移 长 期 预报 的 性 能 ， 首 先 将 本 文 的 预报 结果 同 Liao 等 的 BP 神 经 
网 络 预报 结果 进行 比较 和 分 析 ""， 为 了 较为 客观 地 对 二 者 的 结果 进行 对 比 ， 本 文 预报 过 程 中 采 
用 与 Liao 等 相同 的 预报 策略 和 误差 评价 指标 ， 其 中 ， 试 验 数 据 采 用 IERS 发 布 的 EOP 05C04 序 列 ， 
基础 数据 长 度 为 3yr， 预 报时 段 为 2001 年 4 月 6 日 MJD 52005) 至 2010 年 3 月 25 日 (MJD 55280) , 
每 隔 91d 预 报 一 次 ， 一 共 进 行 了 37 期 的 预报 ， 预 报 误差 评价 指标 选用 平均 绝对 误差 (mean 
absolute error, MAE) ， 其 计算 公式 为 


1 
MAE =- P* O; (10) 


k l jal J 


式 中 ，0O;、P, 分 别 表示 j 点 的 观测 值 与 预测 值 ，7 为 预报 期 数 。 


图 2 给 出 了 本 文 极 移 预 报 结果 的 误差 曲线 和 Liao 等 预报 结果 的 误差 曲线 ， 表 1 统计 了 二 者 1d、 
5d、10d、20d、30d、60d、90d、120d、180d、240d、300d 和 360d 预 报 跨 度 的 平均 绝对 误差 。 从 


图 2 和 表 1 可 以 看 出 ， 对 于 x 分 量 中 长 期 预报 ， 除 了 120d、180d 和 240d 的 ELM 神 经 网 络 方法 的 预 


Pp 
WEMAS Liao MBP AHS P28 Te, 其 余 跨度 的 预报 精度 均 优 于 Liao 等 的 BP 神经 网 络 方法 ; 
对 于 x 分 量 中 长 期 预报 ， 除 了 120d、180d 和 240d 的 ELM 神 经 网 络 方法 的 预报 精度 稍 逊 于 Liao 等 


的 BP 神经 网 络 方法 ， 其 余 跨 度 的 预报 精度 优 于 Liao 等 的 BP 神经 网 络 方法 或 与 之 相当 ; 对 于 yy 分 


量 中 长 期 预报 ， 除 了 120d 的 预报 精度 稍 逊 于 Liao 等 的 BP 神经 网 络 方法 ， 其 余 跨度 的 预报 精度 优 
于 Liao 等 的 BP 神经 网 络 方法 或 与 之 相当 。 从 图 2 还 可 以 发 现 ，ELM 神 经 网 络 预报 误差 曲线 变化 比 
较 平 级， 预报 误差 呈现 逐渐 增 大 趋势 ， 而 BP 神经 网 络 预报 误差 曲线 跳跃 较为 明显 ， 预 报 误差 不 


稳定 
Sak KE o 
表 1 ELM 神 经 网 络 极 移 预 报 与 Liao 等 预报 结果 的 平均 绝对 误差 统计 (单位 : mas) 
Table.1 MAE statistics of the pole coordinate predictions obtained by the ELM and Liao (unit: mas) 
跨度 /d 1 5 10 20 30 60 90 120 180 240 300 360 
Liao ™” 
Xp 2.12 17. 64 21. 84 21.21 21.70 24.83 25.96 23.99 22.74 25.40 27.70 32. 59 
Ys 1.52 11. 86 16. 87 17.71 18.60 21.58 23. 93 23. 68 27. 67 33. 50 31. 44 31.99 
ELM 
x, 0. 70 1.95 3. 11 6.19 9. 36 19.10 25.11 25.57 26.46 27.48 27.75 30. 92 
A 0. 43 1.19 2.73 5. 49 8. 27 17.26 23.37 26.80 27.44 31.25 30. 58 31. 48 


平均 绝对 误差 (MAE) mas 
平均 绝对 误差 (MAE) mas 


0 100 200 300 400 0 100 200 300 400 
预报 跨度 / d 预报 跨度 / d 
图 2 ELM 神 经 网 络 预报 误差 与 Liao 等 预报 误差 的 对 比 
Fig. 2 Comparison of the prediction errors for pole coordinates obtained by the ELM and Liao 


为 了 进一步 分 析 ELM 神 经 网 络 方法 的 预报 性 能 ， 本 文 也 预报 了 2005 年 10 月 1 日 至 2008 年 2 月 28 
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日 (与 EOP PCC 时 段 相同 ) 不 同 预报 跨度 的 极 移 值 ， 并 将 本 文 预报 结果 的 平均 绝对 误差 与 EOP PCC 


预报 结果 的 平均 绝对 误差 进行 对 比分 析 和 分 析 ”， 
的 不 同 团队 的 编号 ， late 
详细 情况 详 见 文献 [9]， 其 
黑色 实 线 ) 和 IERS EOP 产 品 
是 Kalarus (编号 061， 


色 实 线 ) ; 
(编号 051， 


一 位 的 Kalarus 团 


网 络 方法 的 预报 精度 大 体 处 于 所 有 


黑色 实 线 ) 、 


中 长 期 (1 一 500d) 预报 精度 较 高 的 
灰 蓝 色 实 线 ) 。 
从 图 3 一 图 5 可 以 看 到 ， 对 于 1 一 10d 的 
队 的 预报 精度 ， 优 于 其 他 团队 的 预报 
团队 的 居中 位 置 ; 


， 极 移 超 短 
i (Hi'SO71, 2 


Zotov 〈 编 号 091， 


如 图 3 一 图 5 所 示 ， 图 中 数字 代表 参与 EOP PCC 
| 线 表示 不 同 团队 预报 结果 的 平均 绝对 误差 ， 参 与 BOP PCC 的 团队 
期 (1 一 10d) ed (编号 061， 
KAKE) ; 


AW (1~30d) 预报 精度 较 高 的 团队 
Sages 和 Kosek 编号 051， 灰 蓝 


团队 是 Kalarus (编号 061， 黑 色 实 线 ) 和 Kosek 


馈 短 期 预报 ,ELM 神经 网 络 方法 的 预报 精度 仅 低 于 排 在 第 


HE; 对 于 1~30d 的 短期 预报 ，ELM 神 经 


对 于 1 一 500d 的 中 长 期 预报 ，ELM 神 经 网 络 


方法 的 预报 精度 低 于 排 在 第 一 位 的 Kalarus 团 队 的 预报 精度 ， 稍 逊 于 排 在 第 二 位 的 Kosek 团 队 的 


预报 精度 或 与 之 相当 ， 优 于 其 他 


5.0 


@) x, aly ~1 iii 


团队 的 预报 精度 。 


3.0 


©) 轧 超 短期 (1~10d) 预 报 
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图 3 ELM 神 经 
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预报 跨度 / d 
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Fig. 3 Comparison of the ultra short-term (1~10d) prediction errors obtained by the ELM and EOP PCC 
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图 4 ELM 神 经 网 络 短期 (1 一 30d) 预报 误差 与 BOP PCC 的 对 比 
Fig. 4 Comparison of the short-term (1~30d) prediction errors obtained by the ELM and EOP PCC 
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图 5 ELM 神 经 网 络 中 长 期 (1 一 500d) 预报 误差 与 EOP PCC 的 对 比 
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Fig.5 Comparison of the medium- and long-term (1~500d) prediction errors obtained by the ELM and EOP PCC 


4 结 


本 文 针 对 极 移 序 列 非 线 性 、 非 平稳 变化 的 特性 ,将 一 种 新 型 ELM 神 经 网 络 用 于 极 移 中 长 期 预报 。 
通过 预报 试验 可 以 发 现 ， ELM 神 经 网 络 用 于 极 移 中 长 期 预报 可 以 获得 较 好 的 预报 效果 。 与 BP 神经 
网 络 预报 结果 的 对 比 表明 ，ELM 神 经 网 络 的 预报 精度 优 于 BP 神经 网 络 的 预报 精度 ， 与 BOP PCC 预 
报 结果 的 比较 发 现 ，ELM 神 经 网 络 的 中 长 期 预报 精度 优 于 大 部 分 参与 EOP PCC 团 队 的 预报 精度 。 
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Medium- and long-term prediction of polar motion using 
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Abstract: Linear models such as least squares (LS) extrapolation and autoregressive (AR) 
models get used to prediction Earth’s polar motion. However, polar motion predictions obtained by 
linear models are not fully satisfactory owing to the non-linear and non-stationary variations in polar 
motion. In this paper, the extreme learning machine (ELM), a new training algorithm for single hidden 
layer feedback neural network (SLFN), is employed to prediction medium- and long-term polar 
motion. The LS extrapolation model is first employed to separate a linear trend, Chandler and annual 
wobbles (CW and AW) from observed polar motion time-series. The extracted linear trend, CW and 
AW are then predicted by using the above-mentioned LS extrapolation model. Secondly, the ELM is 
used for modeling and forecasting the residual time-series obtained by subtracting the LS 
extrapolation curve from the original polar motion data. In ELM training some special issues such as 
generation of training patterns and topology of the network for enhanced medium- and long-term 
prediction of polar motion are taken into consideration. The subsequently forecasted residuals are then 
added to the LS extrapolation so as to obtain the predicted values of polar motion. In order to 
demonstrate the effectiveness of the presented method, the results of the predictions of polar motion 
are analyzed and compared with those obtained by the back propagation (BP) neural network and 
Earth Orientation Parameters Prediction Comparison Campaign (EOP PCC). The results show that the 
predictions are comparable with or better than those obtained by other existing prediction methods and 
techniques in terms of the mean absolute error (MAE). 

Key words: Polar motion; Prediction; Extreme learning machine; Neural network; 
Prediction model 


